机器学习 基础2-new
人工智能、机器学习和深度学习 机器学习是人工智能的一个实现途径 深度学习是机器学习 的一个方法(神经网络)发展而来 深度学习源自神经网络中的卷积网络
深度学习 : 机器学习的分支,人工神经网络为基础,对数据的特 征进行学习的方法
机器学习和深度学习的区别 a. 特征抽取: i. 人工的特征抽取的过程 i.深度学习:自动的进行特征抽取 b. 数据量 i. 机器学习:数据少,效果不是特别好 i.深度学习:数据多,效果更好
一个神经元的功能是求得输入向量与权向量的内积后,经一个非线性传递函数得到一个标量
主要分支介绍 1.计算机视觉 eg:人脸识别 2.自然语言处理 语音识别 语义识别 3.机器人
工作流程 1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估
获取到的数据集介绍 1.专有名词 样本 特征 目标值(标签值) 特征值 2.数据类型构成 类型一:特征值+目标值 目标值分为是离散还是连续 獎型二:只有特征值,没有目标值 3.数据划分 训练数据(训练集) 构建模型 0.7--0.8 测试数据(测试集) 模型评估 0.2--0.3
数据基本处理 对数进行缺失值、去除异常值等处理
特征工程 1.定义 把数据转换成为机器更容易识别的数据 2.为什么需要特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已 3.包含内容 特征提取 特征预处理 特征降维
监督学习 有 特征值+目标值
线性回归 (连续的) 房价上升
离散 (分类) 输出 0或1 是否患有肿瘤
无监督学习
有 特征值 无目标值 没有标准答案
聚簇分类 谷歌新闻 推荐算法
半监督学习 有特征值,但是一部分数据有目标值,一部分没有
强化学习 动态过程,上一步数据的输出是下一步数据的输入 四要素:agent, action,environment, Reward, 动态规划